Agent 时代已至:LLM 的下一步

2026-02-09 | 浏览: -

周末看到两条新闻:

  • Anthropic 推出 Claude Opus 4.6 以及 Agent Teams 功能

  • OpenAI 发布 Frontier 平台,加速企业级 AI Agent 的部署

说实话,我并不意外。因为这一天,其实早就“一只脚踏出来了”。

先给自己脸上贴点金(笑):
我在之前的文章里就提到过这个疑问——

Agent 是不是一条弯路? 在反复读《Hello-Agents》之后,我反而开始怀疑,我们是不是在刻意回避一个更本质的问题:训练模型本身

现在看,这些新闻更像是对那个判断的某种回应。


这只是第一步,而不是终局

目前,无论是 Anthropic 还是 OpenAI,本质上都还在做同一件事:

基于自有 LLM,构建深度耦合的 Agent 框架与工具链。

换句话说,是“用自己最懂的模型,去打磨最适合自己的 Agent 体系”。

从这个角度看,不管是 Manus、OpenClaw,还是其他第三方方案,又有谁能比大模型厂商自己更有说服力呢?

但这显然不是最后一步。

因为在我的设想里,他们现在提供的,仍然是Agent 框架本身:

  • 要么是为自家模型深度优化的 Agent 架构

  • 要么反过来,模型在训练阶段就已经针对这种架构做过 Agentic Reinforcement Learning

这两件事,本质上已经开始互相“咬合”。


题外话:DeepSeek 的一个细节,可能不是偶然

这里我想插一段题外话。

最近大家都在期待 DeepSeek 在春节期间发布 V4,也在猜它能 SOTA 多久。但我反而在想,它会不会走一条类似 Anthropic / OpenAI 的路径。

如果你去看 DeepSeek V3.1 / V3.2 的参数设置,会发现一个挺有意思的点:

  • 上下文窗口长度在不断提升

  • 但输出 max token 始终只有 8K

  • 推理模式下虽然可以到 64K,但思维链本身会消耗大量 token

这意味着什么?

结合它的定价(输入 2 元 / MToken,输出 3 元 / MToken),你会发现:
它几乎没打算让你用它来做长文输出。

更合理的使用方式是:

  • 组织一个很长、很复杂的上下文

  • 用 8K 输出拿到结构化信息

  • 再把结果喂回下一轮上下文

这本身就是一个典型的 Agent 设计思路

所以我越来越觉得:这不是“限制”,而是某种有意为之的产品取向。 我考虑用另一篇文章来完整表达一下我这部分思考


回到问题:个人开发者该怎么做 Agent?

思路拉回来。

如果你是个人开发者,或者像我一样的非专业开发者 Agent 发烧友,那问题就来了:

我们到底该以什么原则,来构建“只为自己服务”的 Agent?

我先抛砖引玉,给自己总结了几条原则。

原则一:不要幻想“什么都能帮我做”
目标一定要单一,路径一定要清晰。
Agent 一旦变成“万能助理”,基本就等于失控。

原则二:不造轮子,只造连接器
必须承认一件事:
我既写不出高深的 Agent 调度算法,也设计不好复杂的记忆系统。
那就老老实实,把现成的 Agent 框架、记忆框架按自己的需求连接起来

原则三:不追求“最优 Agent”,而是“最适合自己工作流的 Agent”
把 Agent 当成“自动化自己”的工具,
而不是“模拟一个聪明的人”。

原则四:模块化设计 + 显式状态管理
从小工具开始,一步一步扩展。
每完成一个模块,都应该是可测试、可验收、可回滚的。


那企业呢?谁会真正被 Agent 改变?

如果你是企业员工(我就是),那另一个问题就绕不开了:

大型企业 vs 中小企业,在 Agent 这件事上的最优策略,真的一样吗?

我的判断可能有点激进:

未来 3–5 年,真正被 Agent 深度改变的,很可能不是大型企业,而是中小企业。

原因并不复杂。

大公司有很多“必须谨慎”的包袱:

  • 数据合规风险

  • 供应商锁定风险

  • 遗留系统集成风险

  • 组织与流程变更成本

而中小企业恰恰相反:

  • 决策链短

  • 容错空间大

  • 流程本就不完善(反而好改)

  • 几乎没有沉没成本

所以我甚至在想:
中小企业会不会最先,真正让 Agent 变成“直接干活的虚拟员工”?

不是辅助,不是建议,而是:

  • 真的发邮件

  • 真的改表格

  • 真的跑脚本

  • 真的对接客户

对他们来说:

  • 60 分:已经值回票价

  • 80 分:就是物超所值

他们不追求永不出错,只追求:
比人便宜 + 比人快 + 错了能改。


但这也引出了最后一个问题

中小企业的劣势也很明显:
他们没有资源,也没有意愿去自研 Agent 框架。

这也许正是 Anthropic 和 OpenAI 的目标:

  • 用 Claude Code / Codex

  • 配合自家的 Agent 平台

  • 帮中小企业“低成本上线 Agent 能力”

可问题是:

那些非 LLM 厂商,如果要入局 Agent,
在底层能力明显不占优势的情况下,
他们还能靠什么策略破局?

是做垂直场景?
做流程整合?
还是干脆放弃“通用 Agent”,只做行业 Agent?

这个问题,我也还在想。
你们怎么看?

标签: 人工智能AI Agent大模型应用技术趋势开发者指南

留言

加载中...